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Umsetzerzur Obertragung von Quellencode 

Es wird ein direlcter biteffizienter Umsetzer von Pro- 
grammcode in einen Bitstmm fur die Obertragung angege- 
ben. Die empfangerseitige RekonstruJcbon hefert emer, i syn- 
taktisch und logisch gleichwertigen Programmcode. Dabei 
wird ein Quelienprogramm, geschrieben in elner Hochspre- 
che wie C/C++, Fortran. Java yaw eo in erne > ™o\g* 
umgesetrt. daB zum einan etna moghchst fle n "0*^enge 
erforderiich ist und zum anderen nach einer Obertragung em 
syntaktisch und logisch gleichwertiger Programmcode ent- 
stent. Dazu warden den reservierten Sprachworteiv aber 
auch den Sonderzeichen und Operatoren feste Brtfolgen 
zugeordnet die wesentlich weniger Bits benotiger, i els die 
direkte Darstellung der reservierten Sprachworte und Ope- 
ratoren/Sonderzeichen im Rechner. Der Obersetzer kann 
uberall dort angewandt warden, wo Programmcode uoertra- 
qen warden muB und eine transparente Obertragung nicht 
erforderiich ist, wie dies zum Beispiel der Fall ist, wenn der 
ubertragene Code im Decoder nur compiiiert warden muB 
und wenn kelne weitere Bearbeitung des Codes auf Empfan- 
gersaite stattfindet 
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Beschreibung 

DieErfimtangtatriffiemen^ 

^Die'tekannten Umsetzcr von Programmcode m einen Bitstrom fur die Obertragung haben jedoch den 
N n ht6 ^dS^ ^ugrunde, einen Umsetzer zur Obertragung von Quellencode 

ei^r Obertragung ein syntaktisch und logtsch gleichwertiger Programmcode entsteht 

"Stdn Programm aus mehreren Modulen, so werden den FunWonsnamen, ^n a T£w h 

dteAazahl der Variablennamen mit Qbertragen werden. Bei Verwendung von Codes vanaDler i^nge muu . iu 
Se^airZuoXng vorher die Haufigkeit des Auftretens bestunmt werdea Der verwendete Code muB 

MmSSlEaonHd oder alsVorkomma- und Nachkommawertmterprettcrt werden. 

^Erfmdung wird nun anhand eines in den Zeichnungen dargestellten Ausfuhrungsbeispieb naher beschn - 
ben. 

In der Zeichming ist folgendes dargesteflt: 

Fig. 1 Phasen bzw. Schritte der Programmflberseming; Wpn Raum ^ 
Sgi 2 ein vereinf achtes Beispiel fur einen von der Syntaxanalyse erzeugten abstrakten Baum unci 
i?:- * Cs*iif-;tt«» wr Pectlemn? des Umsetzers. ... ♦ • 



30 



35 



40 



45 



50 



55 



60 



65 



undbesclutabtmchtdenvolIenSprachu^ 

Jedes Hochsprachenprogramm besteht aus versch.edenen "^^^^SS^^SSoS^ dessen 
Jeder Teil bzw Anweisungsart beginnt in dieser Realisierung nut einem entsprecnenden Mancoae , aess 
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. . K„„«t;<Tten Startcodes abhangt Ein Beispiel der wcsentlichsten Anweisungsarten ist 



Tabelle 1 

Startcodes fur Programmteile bzw. Anweisungen 



f XilCX UUB 


00010 


IJaf n TIP 

del xiie 


00011 


nnfinit inn alobaler Variablen 


00100 


Definition localer Variablen 


00101 


Definition einer Methode 


00111 


Aufruf einer Methode (einer Klasse) 


01001 


Aufruf einer Methode mit Zuweisung 


01010 


Tn^tanzieruncf einer Klasse 


01000 






Start des n iaain n -Programmes 


01011 


Ende des "main" -Programmes Oder einer 


01100 


Klasse 




Aus f uhrungs anwe i sung 


01101 


"wtiile" Anweisung 


OHIO 


"end of while" 


01111 


n for" Anweisung 


10000 


npnd of for 11 


10001 


"if n Anweisung 


10010 


"else" Anweisung 


10011 


"end of if" 


10100 


Definition einer Klasse 


10101 


Aufruf einer Funktion Oder eines Modules 


10110 



Im 



folgendenwerden Beispiel fur einige dieser ProgrammteHe bzw. Anwei sungen gegeben. 
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Darstellung von Integerzahlen 

Die folgende Art der Darstellung von Integerzahlen wird in dieser Realisierung verwendet: Das Vorzeichen 
wird uber 1 Bit signalisiert, der Betrag in das duale Zahlensystem gewandelt Diese Darstellung wird in Stucke 
der Lange von 7 Bit unterteilt Die Anzahl der Stucke ergibt die fur die Obertragung benotigte Anzahl von Bytes. 
Das noch freie Bit des Bytes wird mit einer Signalisierung belegt, ob fur die Darstellung weitere Bits folgen 
(n*(7 + 1)-Bit Darstellung). 

Der "include" Teil 

Werden dera Compiler bekannte Files durch die Include"- Anweisung eingefugt, so kann jedem dieser bekann- 
ten Files ein Codesymbol zugeordnet werden. Ein Beispiel hierfur gibt Tabelle Z 

Tabelle2 

Codeworte fur bekannte Dateien 



20 


<f stream. h> 


1000 




<string.h> 


1001 


25 


<iostream . h> 


1010 




<ctype - h> 


1011 


30 


<stdio.h> 


1100 




<stdlib-h> 


hoi 1 



35 

DerTeil mit "incIude'-Anweisungen hat in dieser Realisierung folgende Gestalt: 



# include <fstreanxh> 
40 # include <strmgJi> 

# include <iostreamJi> 

# include <ctypeJi> 

# include <stdioii> 

# include <stdlibJi>, 

45 so kann er dann durch die folgende Bitsequenz dargesteDt werden, bei der zuerst die binare Zuordnung fur 
"# include" Icommt, dann wird durch ein Bit gekennzeichnet, ob es sich urn dem Compiler bekannte Dateien oder 
urn eigene Dateien handelt Es folgen dann die Anzahl der dem Compiler bekannten einzufugenden Dateien, und 
dann die Codes fur die etnzelnen Dateien. Da keine negativen Zahlen auftreten konnen, entfallt hier di 

so Signalisierung fur das Vorzeichen. Somit ergibt sich die folgende Bitfolge: 
00010 0 0000110(0)01100001 00100011 01000101 

Definition von globalen/localen Variablen 

55 Die reservierten Sprachworte fur elementare Datentypen werden wiederum durch Codes dargestellt Ein 
Beispiel hierfur ist in Tabelle 3 gegeben. 
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Tabelle3 

Reservierte Sprachworte fur elementare Datentypen 



int 


0001 




const 


1001 


char 


0010 




static 


1010 


short 


0011 




signed 


1011 


long 


0100 




unsigned 


1100 


float 


0101 






1101 . 


double 


0110 




[] 


1110 


void 


0111 
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20 



25 



gen werdeiL 



TabeUe4 
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Zahl der notigen Bits zur DarsteUung des Variablennamens bzw. des Instanzcnnamens. 
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AnzaHl der Variablen 


Zahl der notigen Bits zur 
DarsteUung im Bitstrom 


2 


1 


4 


2 


8 


3 


16 


4 


32 


5 


• • • 
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char*element; 
char'buffeiflOOO]; 
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intmatrix[10][JO]; 

gibt dann den folgenden Bitstrom: 

00100(Startcode)0000011(0)(ZahIderVariablen) 1101 (^ 0010 ("chaO 00 (null te Variable)1101 (»*") 1110(11*) 

0010 ("char") 01 (erste Variable) 0000111(1)1101000(0) (FeldgroBe) 1110 ("[]") 1110 ("[]") 0001 ("int") 10 (zweite 

Variable) 0001 10(0) (FeldgroBe) 0001 10(0) (FeldgroBe) 

Auf Erapfangerseite kann dies dann rekonstruiert werden zu: 

char * vO; 

char # vl[1000]; 

intv2[10]tl0]; 

mit anderen Namen fur die Variablen. Im Decoder rnussen diese Namen naturhch in konsistenter Weise 
verwendet werden. 

Beginn des w mam w -Programmes 

Die Folge: "mainO f kann einfach durch den Startcode wiedergegeben werden. Der entsprechende Code fur 
"end of program* wird dann im Decoder umgesetzt in "};". Bei Obergabe von Argumenten rnussen entsprechend 
Erweiterungen stattf inden. 

Instanzenbildung 

Die Instanzenbildung von C+ + erfolgt analog zur Definition der elementaren Basistypen. Eine eventuell 
erforderliche (fbertragung der Zuordnung von Originalklassennamen zur Darstellung in einer Bitfolge findet 
vor der Instanzierung statt 

Beispiel 



Klassenname *kl_instanz; 

ergibt, abgesehen vom Startcode und von der Anzahl der zu bildenden Instanzen, 
1 101(*) 001 (Bitsequenz fur den KJassennamen) 0000 (Instanznr. OX 

wobei angenommen wurde, daB 3 Bit fur den KJassennamen und 4 Bit fur eine Instanz erforderlich sind. 

Definition von Methoden 

Wurde zwiscben elementaren Datentypen, Strukturen und Klassen unterschieden, das beiBt wurden fur jeden 
Typ eigene Bitzuordnungstabeilen erstellt, — wie in dieser ReaJisierung — , so muB nacb dem Startcode eine 
Signalisierung erfolgen, was fur ein Datentyp fur die Ruckgabe vorgesehen ist, andernf alls kann diese Signalisie- 
rung entfallen. Der Datentyp fur den Ruckgabeparameter kann dann entsprechend spezifiziert werden. Werden, 
wie in dieser Realisierung, die Codeworte fur Strukturen und Klassen mit einer "0* begonnen (analog wie in 
Tabelle 3 die Codeworte fur elementare Datentypen), so konnen auch die zusatzlichen Datentypen der rechten 
Sehe von Tabelle 3 mitverwendet werden, die Eindeutigkeit ist dann garantiert Es folgt der Code fSr den 
Klassennamen, der Code fur den Namen der Methode und ein weiteres Bit zur Signalisierung; ob diese Method 
mit Parametern aufgerufen wird Wenn ja, kann dann die Anzahl folgen und die Parameter konnen analog zur 
Definition der Variablen/Strukturen/lnstanzen codiert werden. Hierbei ist naturtich darauf zu achten, daB 
entweder die benutzte Bitmenge groB genug ist, urn klasseninterne Parameter und Argumente damit darstellen 
zu konnen, oder es wird eine entsprechende Signalisierung benutzt 

Aufmf einer Methode 

Findet nicht gleichzeitig noch eine Zuweisung statt, so wird zuerst der Startcode kommen, dann die Bits fur die 
Klasseninstanz. Der sich anschlieBende oder kann mit einem Signalisierungsbit ubertragen werden. Es 
folgt dann die Bitfolge fur die Methode. Im allgemeinen ist die Anzahl der Argumente nicht bekannt, es folgt also 
eine Signalisierung, ob und wenn ja, wie viele Argumente vorhanden sind. Diese werden dann ebenfaUs in 
Bitfolgen umgesetzt. Haben Variable, Strukturen, Instanzen und Methoden/Funkttonen keine einheitlicfae Bitfol- 
genzuordnung, so muB, - wenn die Definition der Funktion/Methode nicht bekannt ist und damit der Datentyp 
dem Decoder nicht bekannt ist — , jewels durch zum Beispiel 2 Bit signalisiert werden, am wefchen Typ es sich 
bei dem jeweiligen Argument handelt 

Aiisfuhrungsanweisungen 

Die meisten Ausfuhrungsanweisungen sind recht kurz, und oft ist die Folge von Vamblen/Stnilrturen/Instan- 
zen (y% Sonderzeichen/Operatoren (o) und Konstanten/Strings (c) haufig vorhanden, so daB es sinnvoll ist, fur 
haufig vorkommende derartige Folgen einen eigenen Code zu verwenden. Dabei konnen auch spezielle Anwei- 
sungen wie zum Beispiel Variable + +f oder "variable- Of einen eigenen Code erhalten. Ein kurzes Beispiel 
einer derartigen Zuordnung ist in der folgenden TabeOe gegeben. Vor der Codierung der Konstanten/Stnngs 
wird eine Signalisierung gesetzt, die angibt, urn was es sich im folgenden handelt 



6 



1962236SA1 J > 



DE 196 22 365 Al 

Tabelle7 

Beispie! fur die Zuordnung einiger haufiger Folgen von Vamblen/Strukture^nstanzen (v* 
Sonderzeichen/Operatoren (o) und Konstanten/Stnngs zu B.tfolgen 



vovov 


00001 




ov 


00010 




vo 


00011 




vov 


00100 




vovovo 


00101 




voc 


00110 




vovoc 


00111 




vp 


01000 


var++ 


« 


01001 


var=0 


vi 


01010 


var=integer 


leer * 


00000 




escape 


11111 




escapedg 


11110 


var£ — ]=• - • 



10 



15 



20 



^^^^^^^^^^^ 

Strings (c) bekanntso ist das Sonderzeichen w f nicht erforderlich. 
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Tabelle8 

Beispiel fur die Zuordnung der Sonderzeichen zu Bitfolgen 



5 


+ 


00001 




++ 


00101 




- 


00010 




— 


00110 


10 


* 


00011 




+= 


00111 




/ 


00100 




-= 


01000 


15 


1 


01010 




&& 


01001 




< 


01111 




1= 


01011 


20 


> 


10001 




or 


01100 




10010 




« 


01101 


25 


] 


10011 




» 


OHIO 



30 




10100 




<= 


10101 




& 


11001 




>= 


10110 


35 


( 


11010 




* 


10111 




) 


11011 






11000 


40 


7 


11111 




(( 


11100 










)) 


11101 


45 








]= 


11110 



so Im folgenden Beispiel wird der Startcode nidit mit aufgefuhrt, vier Bits seien fur die DarsteUung von 
Variablen notig. Die Unterscheidung zwischen Variablen, Strukturen, Instanzen und Methoden/Funktionsaufni- 
fen geschieht hiermit einera 2-Bit-Flag. 
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i++; 


01000 (vp) 01 (Variable folgt) 
0010 (zweite Variable) 


loop=0 ; 


01001 (vz) 0011 (dritte Variable) 


buffer[i]='2'; 


00111 (vovoc) 01 (Variable folgt) 
0001 (erste Variable) 10010 
(Sonderzeichen: [ ) 01 (Variable 
folat) 0010 I zweite Variable) 
11110(Sonderzeichen: ]=) 
00000110 (3 Byte ASCII folgen) 
'2' (in ASCII ubertragen) 


buf=bu£fer[i]; 


00101 (vovovo) 01 (Variable folgt) 

0100 (vierte Variable) 10100 

{ Sonderzeichen: =) 01 (Variable 

folgt) 0001 (erste Variable) 

10010 ( Sonderzeichen: [ ) 

01 (Variable folgt) 0010 (zweite 

Variable) 10011 (Sonderzeichen:]) 
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15 



20 



30 



Um komplexeren Anweisungen, deren Reihenfolge nicht in der obigen Tabellc aufgenommen ist, Bitfolgen 
zuzuweisen, kann "escape* mit einer modifizierten Syntaxstruktur benutzt werden, deren Struktur wohl am 
besten aus dem folgenden Beispiel hervorgeht Durch entsprechende Signalisierung wird dabei stets angegeben, 
was als nachstes zu erwarten ist: 
Variable/Struktur/Instanz 
Sonderzeichen/Operator 

Funktion/Methodenaufmf .... 

In Fallen, in denen diese Signalisierung nicht ausreicht, folgt eine zweite Signalisierung. 

Beispiel 



35 



40 



45 



Der Anweisung 
buffexp]=((i+k)/(buf-l))&&bufler[k]; 

kann dann, abgesehen wiederum vom Startcode, die folgende Bitfolge zugeordnet werden: 
11111 (escape) 01 (Variabie/Struktur/Instanz folgt) 01 (Variable folgt) 0001 (erste Variable) 10 (Sonderzeichen/ 
Operator folgt) 10010 (Sonderzeichen: Q 01 (Variabie/Struktur/Instanz folgt) 01 (Variable folgt) 0010 (zweite 
Variable) 10 (Sonderzeichen/Operator folgt) 11110 (Sonderzeichen: ]=) 10 (Sonderzeichen/Operator folgt) 
ltlll(Q)defurBefehlsende:)usw. , _ . 

Die Benutzung von "escape" benotigt im allgemeinen eine groBere Bitmenge als wenn eine der vordennierten 
Folgen von Variablen/Strukturen/Instanzen (v) Sonderzeichen/Operatoren (o) und Konstanten/Strings (c) be- 
nutzt wird. 

Kontrollanweisungen ("for", "while*, "if, "else") "for" 

Nach dem Sprachwort "for' werden 3 Ausdrucke, getrennt durch *f in Klammera erwartet, wobei in diesen 
Ausdrucken auch Komrnas erlaubt sind. Nach dem Startcode fur die "foi^-Anweisung folgen direkt 3 Ausfuh- 
rungsanweisungen, die naturlich auch leer sein konnen, Auf Empfangerseite wird dann die entsprechende Syntax 
mit B for( ..;..;..){" wiederhergestellt Fur das Ende der Schleif e wird auch in entsprechender ''Startcode 
ubertragea Dazwischen kSnnen beliebige Anweisungen erfolgea 

Im folgenden Beispiel ist "k" die 14. Variable und "element" die 1. Variable, Die Anweisung 
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f or (k - 0; k < element ; k + + ) { 

kann dann die folgende Bitfolge geben: 
10000 (start code) 
ersterAusdruck: 

01001 (vz) 01 (Variable folgt) 1110(14. Vanable) 

dritterAusdruck: . 
01000(vp) 01 (Variable folgt) 1 1 10(14. Vanable) 

"while" 

Der Unterschied zur "for"-Anweisung besteht ausschlieBlich in der Anzahl der in Klammero nachfolgenden 
Ausdruckcdie Syntax kann also analog erfolgen. 

TT 

Analoe zur "while'-Anweisung erwartet die "iT-Anweisung ebenfaDs einem Ausdruck, die Syntax erfolgt 
anltozzu "wLeMDer Startcode fur das Ende der TT-Schleife wird dann im Decoder umgesetztin V. der Cod 
KuMm wird im Erapfanger wieder umgesetzt in "} else ". «> daB vor der "else" -Anwetsung , kern 
Sde zu «fo£KS de7das Ende der "iT-Anweisung gibt Die "elseif-Anweisung muB ebenfalls T nut 
erzeugen, erwartet ansonsten aber auch einen Ausdruck. 

Patentanspruche 

1 UmsetzerziirObertragungvonQuenenaxie,iiB^ 
Fo^Ser^vfm^e^it^ 

syntaktisch und logischgleichwertigen Programmcode liefert, dadurch gekennzeichnet, 

Ktamitteb Syntaxa^alyse erzeugterabstrakter Baum in bneffmenter We^e^iert^rdund 

daB zur Festlegung des Umsetzers reservierten oder spezieQen Sprachworten kurze Bitfolgen zugeordnet 

d^htels lexikalischer Analyse den Symbolen kurze Bitfolgen zugeordnet werden. 
daB aiifin^ der lexikafischen Analyse auchto^ 

daB AnSngen wie Deklaratio«C Funktionsaufnif, aritbmetische Anweisung usw„ Schlusselworte als 

^JSSSSSStSi ^eHbaumes angegeben wird, falls diese Struktur nicbt eindeutig mh dem 

Schlusselwort festgelegt ist, . 

daB Schlusselworte und Bitfolgen in eindeutiger Weise kombimert werden raid 

daB to S^boZ die nach auBen bekannt sein mussen. die Zuordnung des Symbols zu der mtern benutzten 

codes die Symbole, zum Beispiel bei Huffmann oder Entropiecodierung, die Haufigke.t j^es Symb les 
K^timmt wird und eine entsprechende Zuordnung zu Bitfolgen mogbchst germger Lange erfolgt und/oder 
Sprachworte (inklusive Sonderzeichen und Operatoren) die Haufigkeit jedes resemer- 
SsprSS^u^twirdund eine entsprechende Zuordnung zu Bitfolgen mogbchst gennger Lange 

3*eAhren nach Patentanspruch 1. dadurch gekennzeichnet. daB bei Verwendung fester 

5e Symbole diesen entsprechende Bitfolgen zugeordnet werden, wobe. d^I^e^der B.tf olge von der 

^rfaM daB fur aUe Symbole Ober eine 

ltr£^ 

BeUpidVariablenname, Funktionsname, Klassenname, Instanz eine eigene Symbohabelle erstelh £nrd und 
St Se zSrdnung von Bitfolgen getrennt erfolgt und daB in nicht eindeutigen Fallen die Symbolart mit 

?Verfahren*Sh Patentanspruch 2 oder 3. dadurch gekennzeichnet, daB hiufiger vorkommenden Kombi- 
?Ver£rW 

menzuden Bitfolgen dann zusatzBchObertragen wird, wenn diese bemiEmp^ 

8 Verfahren nach Patentanspruch 3, dadurch gekennzeichnet, daB be. Verwendung ^"^"^i^ 
U^edeV Bitfolge berechnet wird durch Bfldung des Logarithms zur Basis 2 von der ^pfedaden 
^^Kundurvtrtteridxt groove guutZaU.wob idann ntweder die Lange der Bttfolge oder 
die Anzahl der variablenNamen mit ubertragen wird. , 
9 VerfahrennacheinemderPatentansprfichel bk 8, d^dureh gekennzeichnet, 

daB die DarsteUung von Konstanten und Zeichenfolgen einheitbch uber Zetchenketten erfolgt. wobei die 

10 
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Zeichenkettenin ASCT-Form^^ft w^nmrf^ Gleitkommadarstellung 
daB Intege-aWen m.t der n ^^^^^Mel dargestellt werden und die Integerzahlen 

Hierzu 3 Seite(n) Zeichnungen 
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